对装备 具 有 类 似 能 力 的 计 算 代 理 , 我 们 介 绍 了Pathdreamer,一个视觉世界模型的代理导航,在新的室 内 环 境 。 给 定 一 个 或 多 个 先 前 的 视 觉 观 察 ,Pathdreamer为训练期间未看到的建筑物中...
对装备 具 有 类 似 能 力 的 计 算 代 理 , 我 们 介 绍 了Pathdreamer,一个视觉世界模型的代理导航,在新的室 内 环 境 。 给 定 一 个 或 多 个 先 前 的 视 觉 观 察 ,Pathdreamer为训练期间未看到的建筑物中...
6659基于点云感知Erik Wijmans1 <$,Samyak Datta1 <$,Oleksandr Maksymets2 <$,Abhishek Das1,Georgia Gkioxari2,Stefan Lee1,Irfan Essa1,DeviParikh1,2,Dhruv Batra1,21 Georgia Institute of ...
针对复杂的室内环境,提出一种新的动态环境下的移动机器人视觉导航方法.该方法以室内常见物体作为自然路标,通过单目视觉建立识别模型来认知环境中的各种物体.首先对室内常见物体建立图像库,并对库中的大量图像采集 ...
1594一种用于现实世界视觉对话导航的自激励通信AgentYiZhu2*,YueWeng1*,FengdaZhu3,XiaodanLiang1†,QixiangYe4,YutongLu1,JianbianJiao41中山大学2诺亚3莫纳什大学4中国科学院大学摘要视觉对话导航(VDN)...
and control, and thus often require considerable amounts oftraining data. This approach to designing navigation sys-tems is in direct contrast to research on human spatial nav-igation, which has shown...
//airbert-vln.github.io摘要视觉和语言导航(VLN)的目的是使体现代理人在现实环境中使用自然语言指令导航。鉴于特定于领域的训练数据的稀缺性以及图像和语言输入的高度多样性,将VLN代理推广到看不见的环
在研究机器视觉的移动机器人导航技术的基础上,基于层次结构,简单介绍导览机器人控制系统的总体方案及软硬件设计。采用图像处理中的边缘检测和模板匹配方式进行机器人的视觉导航,使机器人在结构化道路环境下能够...
10012具有自监督辅助推理任务的视觉语言导航朱凤达1朱毅2常晓军1梁晓丹3、41莫纳什大学2中国科学院大学3中山大学4暗物质人工智能公司[email protected]@[email protected]摘要...
并根据人类的反应进行导航视觉-对话导航除了要解决视觉语言导航所面临的共同挑战外,还需要处理好对话历史中一系列关于时间语境的问题的语言意图,以及对话和视觉场景的协同推理在本文中,我们提出了跨模态记忆网络...
27690用于语义视觉导航的贝叶斯关系记忆0Yi Wu † ¶ Yuxin Wu ‡ Aviv Tamar § Stuart Russell † Georgia Gkioxari ‡ Yuandong Tian ‡0† 加州大学伯克利分校 ‡ Facebook AI研究 § ...
库马尔*2阿南耶·阿加瓦尔1郝志琦2吉滕德拉·马利克2迪帕克·帕塔克11卡内基梅隆大学2加州大学伯克利分校摘要我们利用视觉和亲prioception的互补优势,开发了一个点目标导航系统的腿式机器人,称为VP导航。...
华盛顿大学艾伦计算机科学学院2Facebook人工智能研究3佐治亚理工摘要我们提出了SplitNet,一种解耦视觉感知和策略学习的方法通过将辅助任务和选择性学习的模型的一部分,我们明确地分解视觉导航的学习目标我们在...
https://jacobkrantz.github.io/waypoint-vlnce摘要很少有调查明确地解决了行动空间在语言引导的视觉导航中的作用-无论是在其对导航成功的影响方面,还是在机器人代理可以执行所产生的轨迹的效率方面。基于最近发布...
从地标生成固定导航指令王苏Ceslee Montgomery Jordi Orbay Vighnesh Birodkar Aleksandra Faust IzzeddinGur Natasha Jaques Austin Waters Jason Baldridge Peter AndersonGoogle Research摘要研究了从室内路线上...
基于频率增强的数据增广的视觉语言导航方法(VLN论文阅读),主要增强模型对高频频率的识别
billdol}@microsoft.com0摘要0我们提出了基于视觉和语言辅助导航(VNLA),这是一个基于视觉和语言的任务,其中一个具有视觉感知能力的代理通过语言引导在逼真的室内环境中寻找物体。该任务模拟了现实世界的情景,...
大型视觉语言模型(LVLMs)通过整合来自不同模态的丰富信息,可以全面理解世界,在各种多模态下游任务上取得显著进步。然而,由于其巨大的计算/能源成本和碳消耗,部署LVLMs通常是有问题的。这些问题使得采用传统的...
5287基于卷积神经网络张茵达<$宋舒然<$<$Ersin Yumer<$ Manolis Savva<$ Joon-Young Lee<$ Hailin Jin<$ Thomas Funkhouser<$†普林斯顿大学<$Adobe Research摘要室内场景理解是机器人导航和人类同伴辅助等应用的...
自主导航地图探索机器人操作系统规划领域定义语言规划器路径规划基于采样的算法优化A B S T R A C T安全、有效地探索未知的非结构化环境是自主移动机器人在高维工作空间中的关键。自主探索对于在具有障碍物的环境...
6182基于深度卷积生成模型的快速灵活室内场景合成Daniel Ritchie王凯林 裕安布朗大学{Daniel ritchie,Kai Wang,[email protected]}卧室客厅办公室浴室图1.通过我们的方法生成的合成虚拟场景。我们的模型可以生成...
Mitchell Wortsman1, Kiana Ehsani2, Mohammad Rastegari1, Ali Farhadi1,2, Roozbeh Mottaghi11 PRIOR @ Allen Institute for AI, 2 University of WashingtonIn this paper, we study the problem of learning to ...
173270朝着具有深度可微分规划器的真实世界导航0Shu Ishida João F. HenriquesVisual Geometry Group Universityof Oxford0{ishida, joao}@robots.ox.ac.uk0摘要0我们训练具有体验性的神经网络来规划和...
1DeepNav:学习在大城市中佐治亚理工学院美国亚特兰大samarth. gatech.edu詹姆斯·海斯佐治亚理工学院美国...我们提出了3种监督学习方法的导航任务,并显示如何在城市图中的A* 搜索可以用来生成监督的学习。我们的标
Kuan Fang1Alexander Toshev2Li Fei-Fei1Silvio Savarese112t15380场景记忆变换器用于长时间跨度任务中的具身代理01 斯坦福大学 2 谷歌大脑0摘要0许多机器人应用需要代理在部分可观察的环境中执行长时间跨度的...
269SimGlim:简化基于扫视的主动视觉重建Abhishek Jha Soroush Seifi Tinne TuytelaarsESAT-PSI,KU ...接下来,我们提出了一个简单的基于transformer的主动视觉采样模型,称为我们展示了我们所提出的方法在部分可观察
------()154180HOP: 基于历史和顺序的视觉语言导航预训练0Yanyuan Qiao 1 Yuankai Qi 1 Yicong Hong 2 Zheng Yu 1 Peng Wang 3 Qi Wu 1 *01 The University of Adelaide 2 The Australian...
12123基于可迁移元技能的无监督强化学习李俊成1王欣2唐思亮1史海洲1吴飞1庄月婷1王阳21浙江大学2加州大学圣巴巴拉分校{军成利,司良,石海洲,吴飞,于庄}@ zju.edu.cn,{xwang,william}@ cs.ucsb.edu摘要视觉导航...
自主导航地图探索机器人操作系统规划领域定义语言规划器路径规划基于采样的算法优化A B S T R A C T安全、有效地探索未知的非结构化环境是自主移动机器人在高维工作空间中的关键。自主探索对于在具有障碍物的环境...
15407训练环境测试环境环境级增强编辑样式编辑外观编辑对象类编辑合成环境(一)(b)第(1)款(c)第(1)款(d)其他事项(e)(f)第(1)款ENV EDIT:视觉和语言导航的环境编辑Jialu Li Hao Tan Mohit Bansal ...
GridToPixGridToPixGridToPix1GRID TO PIX:用最少的监督训练具身代理人Unnat Jain1Iou-Jen Liu1Svetlana Lazebnik1AniruddhaKembhavi2LucaWeihs2Ale xanderSchwingg11伊利诺伊大学厄巴纳-香槟分校艾伦人工智能研究...